DOCUMENTATION


DOCUMENTATION
DOCUMENTATION

Le progrès de la science étant une œuvre collective, les informations doivent circuler entre les chercheurs d’une manière aussi rapide et complète que possible. Qu’il s’agisse des méthodes expérimentales employées, des observations effectuées, des essais infructueux tentés ou encore des résultats obtenus, leur connaissance est un stimulant pour le chercheur, un adjuvant précieux dans les sciences d’observation et un point de départ ou un garde-fou pour l’ingénieur et le technicien.

Classiquement, le transfert des informations s’effectue par différents moyens: relations personnelles entre les chercheurs, revues, congrès, activités des bibliothèques et des centres de documentation.

Dans la plupart des disciplines de pointe, certaines équipes de chercheurs qui travaillent dans le monde sur un sujet d’avant-garde sont peu nombreuses, se connaissent et s’envoient régulièrement des «tirés à part» de leurs travaux, d’autres tirent leurs informations de la presse spécialisée (publications périodiques ou comptes rendus de congrès...).

Dans les secteurs qui font appel à plusieurs disciplines (chercheurs ou ingénieurs), on se connaît moins: la participation aux congrès est plus rare car l’intérêt de l’information est plus sélectif dans différents domaines. Pour les ingénieurs, les relations qui les lient à leurs fournisseurs ou à leurs clients constituent une voie par laquelle circulent beaucoup d’informations techniques.

La chimie a joué un rôle particulier dans la promotion des techniques modernes d’information. Placée au carrefour de nombreux axes de recherche scientifique, elle correspond exactement à l’activité d’une branche d’industrie. En outre, l’industrie chimique se trouvant à la base de toutes les activités économiques modernes, ce sont les chimistes qui les premiers se sont sentis dépassés par l’accroissement numérique des documents et par leur difficulté d’accès.

La surabondance des sources possibles d’information ou de matériaux à dépouiller est une difficulté que tous les chercheurs des sciences humaines, qu’ils soient économistes ou sociologues [cf. INFORMATIQUE], linguistes ou lexicographes [cf. LEXICOLOGIE], ont également à résoudre.

Le support le plus utilisé pour la diffusion de l’information scientifique fut longtemps le papier imprimé, mais celui-ci subit la concurrence de procédés plus modernes. Tout d’abord, un nombre chaque jour croissant de documents se présente sous des formes différentes. La plus fréquente est l’audiovisuelle, qui a pris de plus en plus la place du manuel d’enseignement, en particulier dans les pays en voie de développement, et la forme télématique avec l’utilisation du vidéotex.

Des populations entières d’hommes apprennent simultanément la chimie, la physique et l’écriture.

Par ailleurs, le papier imprimé, dont l’emploi est plus simple, a l’inconvénient d’être encombrant, lourd et onéreux à transporter sur une longue distance. En outre, lorsqu’il est stocké en grande quantité, il se prête mal à une manipulation automatisée et à la recherche d’un renseignement.

C’est pourquoi on a stocké les documents sous des formes microphotographiques grâce auxquelles on a gagné au moins 90 p. 100 du volume nécessaire à leur rangement par rapport au papier imprimé. En outre, les microphotographies peuvent circuler par avion, moyennant des dépenses tout à fait raisonnables. Les problèmes posés par la conservation des sources écrites de l’histoire ont été en partie résolus par ce procédé [cf. ARCHIVES].

Comme les documents écrits, on peut microphotographier les films et les séquences de télévision, soit en en réduisant seulement la taille, soit sous une forme entièrement codée en faisant apparaître sur le microsupport les signaux électriques qui définissent les images et les textes.

Le troisième groupe de supports est la bande magnétique d’ordinateur, ou le disque magnétique, ou encore le compact disc. Ces supports sont étudiés pour le traitement informatique; plus onéreux que les précédents, ils nécessitent surtout une conservation en chambre isotherme et une régénération périodique. Par contre, grâce aux possibilités de tri, ils permettent des recherches bibliographiques rapides.

1. Les documents imprimés

Un des problèmes que la documentation pose est la multiplicité et la diversité des sources d’informations dites «primaires», c’est-à-dire celles qui contiennent une information à caractère original. Un relais est nécessaire entre l’utilisateur et les sources; on distingue: les manuscrits, les imprimés (livres ou périodiques), les cartes, les plans, les dessins; ou d’un autre point de vue: les thèses; les rapports internes, les comptes rendus de congrès, les brevets.

Cette énumération montre la variété des formes que prend la diffusion de l’information scientifique et technique, et on conçoit qu’elles se complètent mutuellement.

Publications périodiques

Parmi ces documents, les plus importants en volume sont les périodiques. Ce sont des publications en série dotées d’un titre unique, contenant plusieurs articles répertoriés dans un sommaire et paraissant à intervalles réguliers. Le Centre de documentation du C.N.R.S. est abonné à 26 500 périodiques, et 13 000 font l’objet d’un dépouillement d’où sont extraites de nombreuses notices bibliographiques. Le recensement des revues existantes (y compris celles qui concernent les sciences humaines prises au sens large) conduit à une estimation de l’ordre de 100 000 périodiques. Leur localisation, l’état de leur collection sont possibles grâce au catalogue Ulrich’s (31e éd. en 1992). Le Catalogue collectif des périodiques (C.C.N. ) est également disponible sur microfiches, sur CD-ROM et accessible par Minitel.

Le volume d’information fourni par tous ces périodiques est très inégal: la revue américaine Physical Review dans ses parties A, B, C, D et «Letters» contient de nombreux articles originaux; d’autres revues, à parution trimestrielle, ne parviennent guère à en fournir qu’une cinquantaine, dont l’originalité n’est pas toujours certaine.

Il a été recensé pour la chimie plusieurs centaines de grandes publications, mais, pour avoir une information plus complète, il faut recourir aux bibliographies. Le périodique américain Chemical Abstracts analyse environ 15 000 revues (fig. 1). Il est rare que des revues ne concernent strictement qu’une discipline. En biologie et en médecine, la National Library of Medicine et son système de recherche documentaire Medlars publie mensuellement l’Index Medicus provenant du dépouillement de 3 500 titres et compile près de 300 000 articles par an.

Pour la présentation de ces articles de publications, des propositions de normalisation ont été effectuées; ainsi la mise au point d’un «code du bon usage» en matière de publications scientifiques a reçu, dans son principe, l’accord de tous les pays membres de l’U.N.E.S.C.O. Ce code donne en particulier des règles sur la rédaction des résumés d’auteurs, sur la rédaction du texte des articles en vue de leur bonne intelligibilité. Il invite les auteurs et les rédacteurs en chef à indiquer clairement chaque fois s’il s’agit d’un mémoire scientifique original, d’une publication provisoire (ou note initiale) ou d’un exposé de mise au point. Il demande enfin la conformité avec les normes internationales concernant: les abréviations des titres de périodiques, les symboles, l’ordre des citations, la translittération, les systèmes d’unités de mesure, etc.

Des efforts sont entrepris dans plusieurs pays pour parvenir à un regroupement des petites revues et pour obtenir une qualité homogène des articles publiés. La documentation est une technique à «code» et elle doit travailler sur des «standards» déterminés au même titre que beaucoup d’autres moyens de communication (le chemin de fer ou la télévision par exemple).

Certains de ces codes sont matériels (formats du papier, présentation, caractères, etc.), d’autres sont plus «intellectuels» et par suite peuvent difficilement être aussi rigoureux: ils concernent les résumés d’auteurs, l’extraction éventuelle des «mots clés», l’originalité et la qualité des articles...

Thèses et rapports

Un apport d’information est contenu dans des documents qui ne méritent en général pas d’être publiés dans leur intégralité; ce sont les thèses de doctorat et les rapports d’étude donnant suite à des contrats passés par des organismes publics ou parapublics (Commission américaine de l’énergie atomique, département de la Défense, organisations spatiales, National Science Foundation, ou, en France, les organismes scientifiques qui dépendent du ministère de la Recherche et de la Technologie).

Ces documents, souvent volumineux et touffus, présentent un intérêt capital, car ils rendent compte rapidement des travaux effectués, pour ainsi dire au fur et à mesure de leur exécution, alors que l’élaboration d’une publication demande des délais qui atteignent jusqu’à une année. En outre, ils contiennent de précieux renseignements, non publiables, sur les difficultés rencontrées, sur les expériences malheureuses (renseignements que l’on ne trouve nulle part ailleurs) ainsi que les «protocoles d’expérience» indiquant les conditions dans lesquelles tel ou tel résultat a été obtenu.

Quelques-uns de ces rapports, lorsqu’ils intéressent la défense d’un pays ou lorsqu’ils contiennent des inventions brevetables, sont tenus secrets pendant quelque temps; toutefois, la plupart d’entre eux sont parfaitement accessibles, mais on ne sait comment se les procurer. Ils constituent une littérature de faible diffusion (quelques exemplaires déposés dans une bibliothèque ou le plus souvent, une microfiche) dont le signalement n’est organisé systématiquement qu’aux États-Unis. Dans les pays européens, le volume des contrats de recherche étant bien moindre, cette littérature a eu longtemps une importance assez limitée. Le C.N.R.S. assure le stockage systématique sur microfiches et le signalement des thèses de doctorat de sciences soutenues en France depuis 1980 ainsi que des rapports faisant suite aux contrats de recherche; ces documents font l’objet de catalogues; les thèses de sciences humaines et sociales sont également répertoriées et disponibles dans la base de données Francis.

Le volume d’information que contient cette littérature de faible diffusion n’atteint pas celui que fournissent les publications. La nouvelle collaboration entre recherche publique et industrie fait apparaître une nouvelle sorte de rapports: les thèses cofinancées par l’État et les entreprises se multiplient, des chercheurs de laboratoires industriels publient des articles de haut niveau.

Comptes rendus de congrès

Les congrès sont par essence le lieu où les chercheurs se rencontrent et nouent des relations personnelles. La publication des communications qui y sont faites a généralement lieu en deux temps: avant la réunion, diffusion aux congressistes d’un recueil de textes (preprints ) ou de «résumés» d’exposés donnant une idée plus ou moins précise du contenu des différentes communications; après la réunion, édition d’un ouvrage contenant le texte complet des communications (actes du congrès).

Malheureusement, ce dernier ouvrage paraît quelquefois tardivement; il s’agit soit d’un livre édité en librairie, soit d’une publication de diffusion limitée qui a sensiblement les mêmes caractéristiques que les rapports ou les thèses.

Livres et ouvrages de synthèse

Avec les livres, on aborde une autre forme de l’information scientifique, quittant le «front» de la recherche ou de l’actualité pour entrer dans celui d’ouvrages condensés et présentés selon une logique intrinsèque. Parmi eux, certains font l’objet de nouvelles éditions, d’autres sont mis à jour régulièrement.

Les livres et les ouvrages de synthèse se placent à la charnière de la recherche et de l’enseignement; ils sont commercialisés par des circuits très variés; leur recensement est facilité par la commercialisation des CD-ROM. La plus grande partie en est élaborée et éditée aux États-Unis, en Europe ou dans des pays de l’ex-Union soviétique. En effet, le régime de l’«année sabbatique» aux États-Unis (une année sur sept, les professeurs américains peuvent demander un congé avec un demi-salaire pour effectuer certains travaux particuliers, dont celui d’écrire un ouvrage) et l’obligation qui était faite en U.R.S.S. aux académiciens d’écrire des ouvrages sont des facteurs très favorables, bien que ces dispositions comportent en contrepartie le danger de susciter certaines publications trop hâtives ou de seconde main.

L’anglais a été choisi par la communauté internationale; pour être lus et reconnus, les chercheurs français ont dû opter pour cette langue.

Brevets

Les brevets concernaient, à l’origine, les inventions techniques dont la plupart ne résultaient pas vraiment d’un travail de recherche. Un brevet est avant tout une arme économique, et son but principal n’est nullement de diffuser la technique. Cependant, cette situation évolue rapidement. Lorsque, par exemple, on recense les brevets déposés en France par des Français au cours des dernières années, on constate que les seuls brevets dont la durée de dépôt dépasse cinq ans sont précisément le fruit de recherches techniques ou scientifiques approfondies. S’il est vrai que la rédaction d’un brevet est orientée dans le but de donner au déposant le maximum d’atouts juridiques, la validité de la protection requiert de plus en plus que le contenu technique ou scientifique soit explicité correctement; la législation américaine est à ce sujet assez exigeante.

Par ailleurs, il arrive qu’un brevet soit sans valeur juridique du fait d’une publication antérieure. Dans plusieurs grands secteurs, les centres de documentation mondiaux signalent les brevets et en donnent des résumés de la même manière que pour les articles de publications et parfois en nombre presque égal.

Un brevet étant souvent pris en même temps dans plusieurs pays et traduit dans les langues de ces divers pays, on est conduit à regrouper, sous une même référence, ses différentes traductions (appelées «brevets correspondants»). En France, les brevets sont gérés par l’Institut national de la propriété industrielle à l’aide de bases de données; cet organisme édite également le Bulletin officiel de la propriété indutrielle (B.O.P.I. ).

Tables de constantes

Les tables de constantes constituent une forme condensée, relativement «stable», de la documentation.

Pourtant, elles se périment vite, car il s’ajoute sans cesse de nouveaux «corps» dont il faut inscrire les caractéristiques dans les tables numériques.

Par ailleurs, il devient intéressant de «chiffrer» sans cesse des propriétés peu utilisées, telles que les constantes optiques (pouvoir rotatoire, constantes spectrométriques, etc.), les constantes électriques ou diélectriques variées, les pouvoirs solvants vis-à-vis de très larges gammes de produits et à différentes températures, etc.

L’élaboration d’une table de constantes comprend deux stades: le premier est le relevé des constantes avec analyse critique des résultats obtenus, dont dépendra la confiance qu’on peut accorder à la table; le second stade est la fabrication et l’édition.

Compte tenu de la rapidité avec laquelle se développe le nombre des constantes à retenir, il devient de plus en plus difficile de tenir à jour des tables couvrant de larges domaines. Plutôt que de faire de fréquentes rééditions de tables, il est préférable de mettre en mémoire les valeurs des constantes au fur et à mesure que les laboratoires de recherche les déterminent et d’imprimer périodiquement les résultats concernant tel ou tel secteur, une recherche en ligne étant toujours possible entre deux éditions.

De telles tables de constantes sont encore disponibles sur papier dans les fascicules «Constantes physico-chimiques» des Techniques de l’ingénieur , dans l’Encyclopédie Belstein et dans le C.R.C. Handbook of Chemistry and Physics ; on peut consulter en ligne ces constantes à partir des données fournies par Chemical Abstracts .

Dessins, schémas, tracés, plans, cartes, etc.

Ces documents ont pour rôle de définir des objets (objets architecturaux, industriels, géographiques). Ils ne constituent donc pas toujours des véhicules de l’information scientifique, dans la mesure où les objets qu’ils définissent sont déjà connus avant d’avoir été mis sur plan, ou découlent de la mise en œuvre de techniques connues. Ils constituent néanmoins, grâce à leur présentation synthétique, des outils de base de l’activité industrielle, urbaine, agricole, touristique, météorologique, etc.; leur emploi s’étend rapidement à la médecine, aux sciences sociales, aux sciences humaines, au fur et à mesure qu’on doit y définir les objets avec plus de précision.

Le nombre de ces documents est considérable, mais, à part les cartes géographiques, ils ne sont pas dans le domaine public et restent pour les entreprises des outils de travail internes.

Du point de vue purement matériel, ils se distinguent des autres documents par leur format en général plus grand, A3 ou A2, mais quelques-uns dépassent les dimensions de la taille A0 (841 憐 1 189 mm; le format A4 est celui du papier ordinaire 210 憐 297 mm. Ils ont souvent posé aux bibliothèques des problèmes de rangement.

2. La micrographie

Ses principes

Le document micrographique est un média photographique sur support d’acétate de cellulose ou polyester qui regroupe le microfilm, la microfiche ou la carte à fenêtre.

Techniquement, la micrographie est rendue possible grâce à la très grande finesse des émulsions de sels d’argent. Lisant un document original, l’œil a un pouvoir séparateur légèrement supérieur au dixième de millimètre. Le diamètre du grain d’argent étant de quelques dixièmes de micromètre dans les meilleurs cas, on peut atteindre un coefficient de réduction de 200 sans aucune altération de l’image. Cela correspond sur la microphotographie à un pouvoir de résolution intrinsèque de 2 000 lignes au millimètre.

La micrographie documentaire s’apparente à la microédition (une thèse de 10 000 pages éditée en microfiches 105 憐 148 mm contient 98 vues) ou à la microreproduction d’œuvres originales ou anciennes; elle intervient également dans la constitution de bases de données bibliographiques, par exemple la B.I.P.A. (Banque d’information publique et d’actualité) à La Documentation française.

Les échelles de réduction les plus courantes sont 16 et 24 pour le format A4. Le système COM permet des réductions bien supérieures.

Microfilms et microfiches

Selon les méthodes adoptées et les besoins, on voit se dégager deux méthodes de classement: celle du stockage sous forme de film en bobine et celle du stockage par document individuel (microfilm coupé ou microfiche).

La première convient très bien pour des collections entières de documents (consultations peu fréquentes et mises à jour exceptionnelles, comme les thèses). Des systèmes de codage par carrés noirs et blancs placés sur la bande latérale du film permettent d’opérer un repérage très commode en arrêtant le défilement du film sur la vue désirée.

La seconde méthode, qui consiste à séparer matériellement l’une de l’autre chaque «unité d’information», est un peu plus coûteuse du fait de son encombrement et de sa surface sensible. En documentation, chaque fiche est subdivisée en 60 images de 11,75 憐 16,5 mm ou en 98 images de 10 憐 12,5 mm, ce qui correspond à des échelles de réduction de 16 et 24 du format A4. La microfiche de 105 憐 150 mm, format A6, normalisée par l’I.S.O. (International Standard Organization), s’est beaucoup développée et est utilisée en sortie d’ordinateur: système COM (Computer Output Microform).

Recherche informatisée d’un document micrographié

Qu’on utilise l’un ou l’autre système, il est possible de désigner un document micrographié en «composant» son numéro sur une sorte de cadran téléphonique, et de l’avoir en moins d’une minute à la portée de la main. Des «norias» (bacs mobiles montés sur chaîne) commandées de cette manière fonctionnent chez les grands constructeurs internationaux d’ordinateurs, pour le classement et la recherche des dossiers des clients. Un premier essai d’assez grande envergure a été fait par le C.N.R.S. pour les sciences humaines. Il existe déjà des systèmes qui permettent de sélectionner une carte ou une fiche dans un ensemble de 100 000.

Restitution en vraie grandeur

Les appareils de microlecture, quoique de plus en plus répandus, causent une fatigue oculaire quand on travaille longuement sur un document. On les utilise soit pour noter simplement quelques chiffres ou indications, soit pour choisir celles des pages microcopiées qu’on souhaite faire reproduire à l’échelle normale. Cet agrandissement, appelé restitution, utilise les procédés de reprographie électrostatique.

Agrandissement par procédé électrostatique

Ce procédé est basé sur la propriété de photoconductivité des semi-conducteurs. Certains d’entre eux ne conduisent l’électricité que lorsqu’ils sont éclairés par de la lumière visible et se comportent comme de très bons isolants dans l’obscurité.

Si on parvient dans l’obscurité à déposer des charges électriques sur une mince couche semi-conductrice étendue sur une surface métallique, et qu’ensuite on projette dessus une image en noir et blanc, il n’y a pas de changement dans les zones noires, mais dans les zones blanches la couche de semi-conducteur devient conductrice et les charges s’écoulent dans le support métallique. On a réalisé une image électrique.

Deux types de lecteurs restituteurs

Pour obtenir effectivement des copies, on utilise l’un des procédés suivants.

Le semi-conducteur (en l’occurrence un corps à très bon marché, l’oxyde de zinc) est incorporé dans le papier sur lequel sera faite la copie. C’est donc ce papier qui est le siège des phénomènes électrostatiques. Après impression de l’image électrique, on disperse au-dessus une poudre noire convenablement chargée d’électricité, qui est attirée par les zones électrisées du papier et reconstitue ainsi l’image visible. Une rapide cuisson fait fondre les grains de poudre et les fixe définitivement.

Un autre procédé consiste comme ci-dessus à répandre de la poudre électrisée sur les zones chargées du semi-conducteur, mais au lieu que ce dernier soit le support même de la photocopie, il sert de tampon imprimeur et la poudre est déposée sur des feuilles de papier ordinaire elles-mêmes convenablement électrisées pour que les grains y adhèrent. La cuisson se fait alors sur la feuille de papier.

Extension de la photocopie

Cette activité, à condition qu’elle soit pratiquée selon des règles strictes, constitue un adjuvant à la diffusion des revues: les articles récents sont peu demandés, car les chercheurs disposent des revues courantes; par contre, les articles anciens ne peuvent être retrouvés que dans les centres de documentation ou les bibliothèques et sont assez souvent à l’origine d’abonnements nouveaux de la part des intéressés.

Pour des raisons évidentes, la microphotographie des livres ne peut être autorisée, de sorte que certains éditeurs scientifiques envisagent, pour alléger les volumes, de procéder à des éditions mixtes dans lesquelles le texte principal serait sur papier, tandis que les annexes et documents de travail seraient sur microfiches, incluses dans une pochette.

3. Les méthodes documentaires

Principes de «gestion» des documents

Pour gérer la documentation, il est nécessaire d’utiliser un système d’information qui regroupe les données, les organise et les rend utilisables. On désigne sous le vocable « informatique » la science de l’information permettant de traiter automatiquement, à l’aide de programmes, des données numériques ou textuelles. Ce terme traduit l’expression américaine data processing . Certains documentaires emploient également le mot «informatique» pour mettre en lumière l’aspect technique des méthodes de traitement des informations qu’ils manipulent. Beaucoup d’entre eux songent en parlant ainsi à une sorte de mathématisation plus ou moins poussée des problèmes que leur pose l’accroissement de la littérature scientifique. On connaît bien le rôle primordial que joue l’informatique pour gérer des stocks de marchandises, ainsi que toutes sortes de comptabilités concernant les biens comme les personnes. Il est clair que la gestion des revues dans les bibliothèques, celle des stocks de documents, des commandes de reproductions photographiques, des microcopies, etc., se fera par des moyens très automatisés, tout au moins dans les centres de documentation les mieux équipés.

Une première étape de l’automatisation consiste donc à appliquer à l’information scientifique les règles et les programmes de calcul déjà élaborés pour les stocks et les mouvements de matériels industriels, cela après les avoir analysés pour tenir compte des caractéristiques particulières des documents et du travail en bibliothèque (sélection, traitement, communication...). Cette étape ne suffit pas car ce qui importe, c’est le contenu du document. Il faut gérer de l’information et non pas seulement des ouvrages.

L’organisation des vocabulaires

Les méthodes de traitement logique et les mémoires centrales devraient se trouver en défaut, par suite du manque de «répétitivité» des objets à manipuler. On tente de surmonter l’obstacle en travaillant sur l’intermédiaire traditionnel de toutes les communications: les mots. Déjà imparfaits et ambigus lorsqu’ils se trouvent dans un contexte, les mots isolés auxquels doivent avoir recours les méthodes de traitement de l’information sont d’assez piètres outils. Comme cela se fait continuellement lors de l’élaboration des langages techniques, des définitions de mieux en mieux circonscrites et caractéristiques se précisent.

Déjà le documentaliste distingue plusieurs sortes de mots:

– Le mot clé , qui est choisi dans le titre ou le texte du document pour en caractériser le contenu. On distinguera des catégories privilégiées variables d’une discipline à l’autre, qui appartiennent le plus souvent à des ensembles désignant des objets concrets. Ce sont les termes spécifiques , par exemple les termes géographiques, les noms de minerais, les dispositifs expérimentaux, les noms de matériaux ou de produits chimiques, les espèces animales ou végétales, etc.

– Le mot outil , généralement adjectif ou adverbe, parfois verbe ou substantif, qui apporte des compléments d’information au mot clé et doit être combiné avec celui-ci. Dans une première approche, ces mots peuvent être omis pour le repérage d’un document.

– Le mot vide , appelé ainsi parce que, pris isolément, il ne désigne ni un objet, ni un concept, ni une action (article, pronom, préposition, conjonction, verbe d’état, verbe auxiliaire, etc.).

D’autres mots – termes abstraits, ou termes moins directement caractéristiques de la discipline étudiée – constituent les termes génériques : mots tels que traitement, communication, préparation, injection, etc. Un même mot peut parfaitement être un terme spécifique dans une discipline, terme générique dans une autre.

Classification et indexation

Un document peut donc être repéré par trois voies différentes. La première consiste à le repérer par ses références (auteurs, revue dont il est extrait, titre, etc.). La deuxième consiste à le faire entrer dans une classification interne plus ou moins dérivée de la classification des sciences. La troisième cherche à caractériser son contenu par un groupe de mots clés. Dans un ou des index, ces mots sont classés par ordre alphabétique, et en regard de chacun d’eux figurent les numéros repérant les divers documents dans lesquels ils ont été choisis comme mots clés. On trouvera ainsi au mot «iso-octane» tous les documents qui traitent de cette substance et de ses propriétés. Ces documents sont désignés chacun par un numéro d’ordre renvoyant à une liste générale des documents considérés, classés soit selon leurs références bibliographiques, soit selon la classification choisie.

Les index

Une méthode simple pour caractériser un document serait de prendre comme mots clés ceux qui sont contenus dans le titre donné par l’auteur. On réalise très facilement par ce moyen des index (appelés parfois K.W.I.C. ou index permutés), dans lesquels chacun des mots significatifs du titre est successivement mis en vedette à une place correspondant à son classement alphabétique. Cependant, les titres sont souvent médiocrement évocateurs du contenu des articles, de sorte qu’il devient utile de les remplacer par un ensemble d’autres mots clés, au nombre variable, extraits par des documentalistes.

Un index est une liste ordonnée de mots clés (noms de personne, de lieu, de matière). Cela suffit pour éditer des index qui permettent la consultation des fichiers pour la recherche «manuelle ou automatique» d’une bibliographie sur un sujet déterminé. Le chercheur qui effectue ce travail a en effet entre les mains les index et les bulletins bibliographiques; il doit connaître l’esprit dans lequel ils sont conçus et recherche les références qu’il souhaite obtenir à tous les endroits où elles sont susceptibles de figurer. L’indexation est l’opération destinée à représenter un document après l’avoir analysé, par des concepts. Ceux-ci sont choisis en fonction du fonds existant dans le centre de documentation, de ses objectifs et des besoins des utilisateurs; cette opération peut être automatisée.

Les thesaurus

En revanche, si l’on traite ce travail par l’informatique, il faut prévoir, pour que la consultation soit fructueuse, d’introduire dans l’ordinateur non seulement les mots clés utilisés pour l’indexation, mais aussi tous leurs synonymes ainsi que les mots de sens apparentés, soit qu’ils soient synonymes les uns des autres dans un certain contexte (généralement au sein d’une discipline), soit que l’un d’eux englobe l’autre dans sa signification.

On est conduit à établir la liste des descripteurs choisis parmi un ensemble de termes équivalents, pour représenter sans ambiguïté une notion apparaissant dans un document. Cette liste est organisée de façon hiérarchique à l’aide de «champs sémantiques» destinés à souligner les relations structurelles entre les termes qu’ils contiennent et constitue un «thesaurus» (fig. 2). Les schémas fléchés sont peu utilisés.

Les outils linguistiques dans la recherche bibliographique automatisée

Ainsi, lorsqu’on interroge le lot de documents contenu dans l’ordinateur, on trouve non seulement les références qui concernent chacun des mots clés sur lesquels on interroge, mais aussi les documents dans l’indexation desquels figurent les mots qui leur sont apparentés. Cette recherche peut aller jusqu’à un degré de parenté plus ou moins lointain.

Bien entendu, une recherche porte en général sur plusieurs mots clés simultanément reliés par la conjonction «et», de sorte que ne sont fournis en réponse que les documents qui contiennent à la fois tous les mots clés de la question (ou leurs apparentés). L’emploi d’autres conjonctions («sauf», «ou») permet de guider la recherche.

Ces méthodes de classification tiennent compte de la variété des relations linguistiques et s’affranchissent dans une large mesure de la hiérarchie des classifications traditionnelles. Elles sont en plein développement car le «dialogue homme-machine» se fait simultanément en langage clair. L’élaboration alphabétiques ou numériques des mots employés se fait automatiquement par le système à l’aide de tris. Le codage reste indispensable pour les composés en chimie organique.

Sélection des documents par ordinateur et mots clés

L’interrogation d’un lot de documents se ramène toujours à un problème de relevé d’occurrences entre les mots par lesquels les documents ont été indexés et les mots qui ont servi à formuler la question posée.

Pour les fichiers de taille modérée (de l’ordre de 10 000 documents), il est intéressant d’examiner une méthode plus simple (par coïncidence mécanique).

Méthode des cartes perforées

Une première méthode consiste à établir une carte perforée pour chaque mot clé. Cette carte comporte un fin quadrillage, chacun des petits carrés pouvant recevoir une information sur l’existence du mot clé dans un éventuel document.

Par exemple, le carré d’abscisse 12 et d’ordonnée 27 est réservé au document 1227. On perfore ce carré si (et seulement si) le document 1227 contient le mot clé qui correspond à la carte.

On peut ajouter dans ce système des documents jusqu’à concurrence de 9 999 (si les cartes comportent 10 000 carreaux) et des cartes, sans limitation (en tenant compte des mots synonymes).

Pour perforer correctement, on est conduit à tenir un petit thesaurus, de manière à affecter à chaque document les mots clés les mieux choisis.

Si l’on pose une question constituée de mots clés reliés par la conjonction «et», on sort les cartes correspondantes, on les empile l’une sur l’autre et on regarde, par transparence, quels sont les trous qui coïncident. Les coordonnées des trous coïncidants donnent les numéros des documents qui contiennent tous les mots clés de la question posée. Cette méthode n’est employée que pour un nombre restreint de documents (quelques milliers).

Avantage des ordinateurs pour les fichiers importants et les fichiers mouvants

L’informatique permet une recherche beaucoup plus détaillée sur un fichier bien plus grand. Le principe est toujours basé sur le relevé d’occurrences, mais les ordinateurs permettent de le faire dans des temps extrêmement courts, alors que d’autres opérations, telles que le tri (qui consiste à intercaler, dans un fichier, de nouveaux éléments à une place déterminée), sont proportionnellement plus longues. Il en résulte que des méthodes que l’on n’aurait pas songé à employer par des moyens manuels deviennent compétitives si elles sont traitées par des machines.

Pour la recherche bibliographique, on est donc amené à donner un aperçu sur deux modes de traitement: une méthode dite «inversée», qui découle directement de celle décrite ci-dessus (coïncidences de trous dans des cartes perforées), et une méthode dite «séquentielle», qui consiste à enregistrer sur bandes magnétiques les numéros de documents au fur et à mesure de leur arrivée.

Méthode inversée

On part d’un fichier de mots clés de base. Les indexations sont faites à l’aide du thesaurus, en utilisant si possible uniquement les descripteurs de ce fichier. De même, les questions seront traduites (soit manuellement, soit automatiquement) dans un langage utilisant exclusivement les termes du thesaurus.

Dans le fichier, les mots clés sont classés par ordre alphabétique et chacun d’eux est suivi des numéros d’enregistrement des document dont il est l’un des repères. Le fichier est inscrit sur bande magnétique. On est obligé de rééditer périodiquement celle-ci pour «trier» de nouveaux numéros de document ou de nouveaux mots clés. En fin d’année, cette bande peut être archivée: elle contient alors tous les mots clés des documents enregistrés dans l’année.

Lorsqu’une question (ou un groupe de questions) est posée, on transfère les mots clés qu’elle contient dans la mémoire principale de l’ordinateur, puis on compare chacun d’eux avec ceux qui sont inscrits sur la bande magnétique contenant le fichier. On en retire la liste des documents correspondant à chacun des mots clés qui figuraient dans la question ou les questions posées. Cette méthode de comparaison peut se faire sur disques magnétiques (fig. 1).

– Lorsque deux mots clés de la question sont reliés par «ou», il faut retenir les numéros de documents correspondant à l’un et à l’autre (union de deux ensembles).

– Lorsque deux mots clés sont reliés par «sauf», on part de la liste des numéros de documents correspondant au premier, dont on supprime tous les numéros qui figurent également dans le second.

– Lorsque deux mots clés sont reliés par «et», il ne faut retenir que les numéros communs (intersection de deux ensembles).

On opère ainsi de proche en proche, en tenant compte des «parenthèses» qui symbolisent les relations logiques entre les divers mots clés de chaque question. On dit qu’on a fait une interrogation en langage booléen .

Une fois ces comparaisons faites, on a recueilli les numéros d’enregistrement des documents réputés pertinents .

Sur une autre bande magnétique, le «fichier bibliothèque», qui contient les correspondances entre le numéro d’enregistrement du document et sa référence bibliographique complète (titre, auteur, etc.), est inscrit dans l’ordinateur.

Il suffit donc de trier les numéros recueillis à l’issue de l’interrogation précédente et de comparer chacun d’eux aux numéros de document contenus dans le fichier bibliothèque. À chaque relevé d’occurrences, on imprime les références bibliographiques correspondantes.

Méthode séquentielle

Sur la bande magnétique qui constitue le «fichier mots clés», les numéros de code sont classés au fur et à mesure de l’enregistrement des documents dans l’ordinateur, au lieu d’être classés selon l’ordre alphabétique des mots clés. Pour enregistrer un document nouveau avec ses mots clés, il suffit d’en écrire les numéros de code, à la suite (d’où le terme de méthode séquentielle) de ce qui est déjà enregistré.

L’opération d’enregistrement est donc plus simple, mais ce gain est perdu lors de la recherche bibliographique. En effet, dans la méthode inversée, les mots clés étant classés par ordre alphabétique, la comparaison était effectuée comme une recherche dans un dictionnaire. Ici, au contraire, il faut comparer successivement chacun des mots clés inscrits sur la bande magnétique avec ceux qui figurent dans la question (ou le groupe de questions). Le nombre des comparaisons est par suite beaucoup plus élevé, mais, en fait, il suffit, pour les effectuer toutes, de faire défiler une seule fois la bande magnétique complète; comme les opérations de comparaison faites dans l’unité centrale sont rapides par rapport à la vitesse de déroulement de la bande magnétique, leur multiplicité ralentit assez peu son passage.

À l’issue de ces premières comparaisons, on aura transféré dans la mémoire centrale (ou dans une autre mémoire auxiliaire rapide) la liste des documents correspondants à chacun des mots clés de la question posée. On continue alors les comparaisons et les associations exactement comme dans la méthode inversée.

Emploi de l’ordinateur pour construire le thesaurus

Ce qui précède n’est qu’un schéma sommaire, ne faisant pas mention de plusieurs méthodes de programmation étudiées en vue de réduire le nombre des opérations élémentaires et le temps d’indisponibilité des organes de traitement.

On peut songer à s’aider aussi de l’informatique pour la construction et l’emploi du thesaurus. Il faudrait «entrer en machine» les mots du thesaurus avec, pour chacun de ces mots, ses trois types de liaison: «X compris dans U»; X contient Y1, Y2, etc.; X voir aussi Z1, Z2, etc. (y compris les liaisons privilégiées et les liaisons occasionnelles ou conditionnelles).

L’intérêt de l’ordinateur est d’être capable de fournir sur demande des listes alphabétiques triées, dans un délai très court. Une fois le thesaurus enregistré et sous réserve qu’on ait écrit des programmes de calcul convenables, on peut alors utiliser le système pour rectifier des indexations, ou des questions, qui n’auraient pas respecté parfaitement les règles du langage documentaire choisi.

On conçoit que, si le thesaurus contenu dans l’ordinateur est très complet et très bien fait, on peut prendre plus de liberté dans le dialogue avec la machine. Certains pensent même qu’il est possible d’y introduire sans aucune préparation les documents eux-mêmes (ou tout au moins des résumés faits sans précaution spéciale) et qu’on parvienne à en retirer des réponses à des questions posées avec un rendement valable. Cette méthode, qui est celle de l’avenir, utilise l’intelligence artificielle; elle n’est pas encore totalement opérationnelle.

Utilisation simultanée de l’ordinateur et de la micrographie

Lorsqu’on est en possession des numéros d’enregistrement des documents répondant à chaque question, il faut avoir recours à un autre fichier, dit «fichier bibliothèque», qui contient les références complètes (parfois même les mots clés et peut-être les résumés), classées par numéros d’enregistrement. On peut penser au microfilm, de 16 mm de largeur par exemple, à condition d’avoir réservé sur le côté une petite bande où sont enregistrés, par un système binaire de carrés noirs et blancs, les numéros-code des micro-images correspondantes. Ces numéros-code sont précisément ceux sous lesquels les documents microfilms ont été enregistrés dans l’ordinateur. Des cellules photoélectriques sont capables de lire le code numérique ainsi constitué, et on peut commander le déroulement du film de manière qu’il s’arrête sur une vue dont on a donné le numéro. Pendant la durée de cet arrêt, on peut lire le résumé correspondant ou en effectuer une photocopie. On obtient ainsi à très bon marché des reproductions de tous les résumés correspondant à des documents représentés par une liste de numéros.

En matière de recherche bibliographique, on pourra donc associer un ordinateur (pour le traitement linguistique des questions dans un «fichier mots clés») et un système de microfilm (pour obtenir des textes de résumés à partir des réponses numériques du système). On pourrait d’ailleurs effectuer une opération semblable avec un système de microfiches classées dans un appareil permettant la sélection automatique.

La fréquence des mots

Les descripteurs peuvent être des locutions consacrées par l’usage, telles que «bacille de Koch», «chemin de fer», «taxe à la valeur ajoutée», «aurore polaire», etc. Certaines font partie du langage courant, d’autres ont une extrême spécificité. Même dans la langue française où l’on répugne à répéter trop souvent un terme dans un article, il est possible en rassemblant de nombreux textes de mesurer la fréquence de chacun des descripteurs; on parle de relevé d’occurrences. Les résultats sont encore plus significatifs si l’on rassemble tous les synonymes d’un même mot.

Degré de technicité d’un texte

La première opération consiste à effectuer des relevés d’occurrences sur des textes courants, les journaux par exemple. On s’aperçoit alors que les mots qui reviennent le plus souvent sont banals et que les autres sont d’autant plus précis et chargés de sens qu’ils sont moins souvent employés. Par hypothèse, on considère que le taux de signification d’un mot est représenté par l’opposé du logarithme de sa fréquence dans la grande presse (théoriquement dans l’ensemble de la langue).

Si, pour un texte non scientifique, on dresse un graphique de la fréquence des mots informatifs qu’il contient, ou mieux du logarithme de cette fréquence, en fonction de leur taux de signification, ce graphique donne une droite de pente (face=F0019 漣 1), les mots ayant le plus grand taux de signification étant les moins souvent employés. Pour un texte scientifique, on s’aperçoit que quelques-uns des points du graphique s’alignent effectivement le long de cette droite (ils correspondent aux mots non spécifiques de la discipline considérée). Mais d’autres se placent tout autrement et forment un «nuage» de points placé nettement au-dessus de la droite et dont la pente moyenne est comprise entre (face=F0019 漣 1) et zéro. La position de ce nuage de points représentatifs donne une idée du degré de technicité du document.

On peut ainsi établir des statistiques sur le niveau des documents, le public auquel il s’adresse. Les documents spécialisés sont souvent incompréhensibles aux non-initiés, parce qu’ils contiennent des mots inconnus d’eux, il est théoriquement possible de gérer un système de questions-réponses en adaptant le niveau scientifique des documents fournis à celui du demandeur, mais cela suppose qu’on ait fait une telle analyse pour chacun des documents enregistrés.

4. La représentation des composés chimiques

Difficultés de nommer les composés chimiques

Théoriquement, les composés chimiques ont tous des noms internationalement reconnus. On pourrait, à première vue, penser qu’il suffit de les utiliser comme mots clés, et parler par exemple de paradichlorobenzène, ou de silicate double d’aluminium et de magnésium, pour pouvoir les repérer. Il n’en est rien car:

– avec des composés un peu complexes, les mots clés utilisés auraient un nombre de caractères beaucoup trop grand pour être mis en mémoire;

– tant pour les minerais que pour les composés organiques, il y a plusieurs manières de les écrire et, en particulier, un classement alphabétique dans un lexique n’aurait pas de sens, un grand nombre de mots commençant par «para», «alpha», «oméga-oméga», etc.;

– un tel système arrive à une impossibilité complète lorsqu’on aborde des corps de masse moléculaire élevée.

Les solutions apportées à ce problème sont diverses, et on ne peut pas dire qu’elles soient entièrement satisfaisantes.

Les minéraux sont, dans l’ensemble, moins complexes que les composés organiques et, surtout, leur variété est limitée par le fait qu’on en découvre relativement peu chaque année. On a donc pu leur attribuer des noms de minerais qu’on utilise souvent comme mots clés (pyrite, kaolinite, etc.). En outre, on les a recensés dans une classification générale codée des minerais, qu’il est possible de tenir à jour (classification de Max H. Hey).

Lorsqu’un composé ou un groupe de composés chimiques donne lieu à des applications d’ordre biologique, médical ou industriel, il reçoit très rapidement un nom technique qui le caractérise parfaitement. Il y a d’ailleurs souvent plusieurs dénominations, mais qui sont rigoureusement synonymes. On peut par suite employer comme mot clé un des synonymes les plus fréquents. La seule difficulté se trouve dans la manière de faire le raccordement avec les articles antérieurs qui traitaient du corps (ou du groupe de composés) en question, avant que celui-ci ne soit entré dans le domaine des applications (par exemple lorsqu’on en a fait la synthèse).

Notation des formules chimiques: Wiswesser

Le mode d’écriture des formules chimiques peut être condensé, de manière à faire tenir sur une seule ligne, avec des signes alphanumériques, des formules qui occupent habituellement une place considérable sur une feuille de papier. Moyennant une vingtaine de règles principales de «condensation», on parvient à ce résultat sous une forme non ambiguë pour des formules déjà même assez complexes.

Voici quelques-unes des règles principales:

– On ne mentionne pas les atomes d’hydrogène liés aux «carbones».

– On ne fait mention des atomes de carbone que par leur nombre, sauf s’il s’agit de carbone isolé (sans aucun hydrogène). Un tel carbone est alors représenté par X (ou parfois Y).

– On utilise les codes ci-après: Q = hydroxyle (OH); V = carbonyle (CO); W = branchement de 2, tel que 2, S2, Si2, etc.; M = groupe NH; Z = groupe NH2.

– Les autres éléments sont désignés par la première lettre de leur symbole (sauf quelques-uns: le chlore, par exemple, s’appelle G). Ainsi, HO–CH2–CH2–CH22 s’écrit Q 3 NW.

– On code les liaisons multiples comme suit: U = double liaison; UU = triple liaison; R = noyau benzénique.

– La position relative des branchements sur un noyau est représentée par des lettres dans l’ordre alphabétique qui se suivent dans le sens des aiguilles d’une montre.

Ce système est très cohérent; il ne rend pas bien compte des propriétés chimiques du corps considéré, et il est d’une assimilation assez longue pour les indexateurs. Il est encore utilisé dans Chemical Abstracts : notation linéaire de Wiwresser.

Système Darc

Le système Darc (Description, acquisition, restitution, conception) est un système de traitement de l’information mis au point par le professeur J. E. Dubois en 1967. Il permet de rechercher des informations sur un composé ou sur une famille de composés dont on a décrit seulement un élément de la structure. L’écran permet de visualiser le nombre de molécules concernées, la formule développée et les références des composés trouvés dans le fichier Chemical Abstracts. Ce système constitue une assistance à la synthèse organique par ordinateur.

5. Délais et présentation

Forme de l’information

Un point qui tient à cœur aux chercheurs et plus encore aux industriels est celui du délai de réponse. Cette réponse peut d’ailleurs revêtir plusieurs formes: a ) abonnements à des publications bibliographiques ; b ) services de microfiches; c ) sorties d’«imprimante» d’ordinateur; d ) l’interrogation des bases de données pour des questions isolées.

Le service du type a est très répandu; il est pratiqué par les grands centres de documentation. À titre d’exemple, le C.N.R.S. outre les nombreux abonnements à son Bulletin signalétique , édite par l’intermédiaire de l’Inist (Institut de l’information scientifique et technique) des publications bibliographiques associées aux bases de données Pascal et Francis.

Rapidité et précision des bulletins bibliographiques

On a longtemps admis qu’un bulletin bibliographique précis, c’est-à-dire contenant pour chacun des articles signalés des éléments informatifs valables (classement, bonne indexation, résumés informatifs) était forcément lent, c’est-à-dire qu’il s’écoulait un laps de temps de plusieurs mois entre la parution des articles et leur signalement.

C’est pourquoi plusieurs centres de documentation se sont mis à éditer des bulletins de titres qui paraissent dans un délai assez court par rapport à l’obtention des documents originaux. Le bulletin Current Contents publie les sommaires d’un grand nombre de revues scientifiques, et les index bimestriels du Science Citation Index donnent les titres des derniers articles scientifiques parus.

Pour un centre de documentation capable de faire traiter sur place ses documents, soit qu’il soit placé auprès d’un laboratoire spécialisé, soit qu’il dispose du concours immédiat de spécialistes, une bonne indexation, un court résumé et même une indication sur le classement peuvent être faits dans l’espace d’une semaine.

Les procédés modernes d’impression permettent d’éditer rapidement, de fournir des services contenant déjà une information précise, l’utilisation du courrier électronique évitant les délais demandés par les moyens de communication.

«Profils de groupe»

Les services énoncés en b et en c ci-dessus correspondent à des «profils de groupe», c’est-à-dire qu’ils concernent des groupes restreints de spécialistes; ceux-ci demandent également une très grande rapidité et souhaitent recevoir des informations chaque semaine dans un domaine scientifique précis. L’Inist, dans sa diffusion sélective de l’information, fournit des «profils standards» (abonnements distincts suivant le nombre de références) et des recherches bibliographiques personnalisées.

Aujourd’hui ces services sont encore chers, car leur intérêt est d’être assez complets, c’est-à-dire d’être extraits d’un flux documentaire de base beaucoup plus important. Cependant, l’intervention systématique de l’ordinateur dans la composition des bulletins bibliographiques permet d’effectuer ces tris à la machine selon les critères faciles à définir, et, par suite, le prix deviendra du même ordre que celui d’un abonnement à une bibliographie plus large.

Services télématiques

Depuis une quinzaine d’années, l’accès à l’information est facilité par le développement de l’informatique documentaire et par l’utilisation des télécommunications et de la télévision.

Les chercheurs de tous niveaux peuvent interroger les bases de données dans les domaines qui les intéressent. Elles sont, en effet, accessibles en conversationnel par l’intermédiaire d’un terminal (système vidéotex). Une base de données est un ensemble cohérent de données bibliographiques, textuelles, factuelles ou numériques, gérées par un logiciel en permettant la création, la mise à jour et l’interrogation. L’utilisateur peut interroger lui-même la base ou bien demander une recherche en différé dans un centre spécialisé; dans ce cas, les articles demandés arrivent rapidement par télécopie.

Certains catalogues de bibliothèques, des dictionnaires, le Kompass, etc., sont enregistrés sur CD-ROM et très facilement consultables à l’aide d’un lecteur.

6. Échanges internationaux

La production des documents scientifiques et techniques se répartit du point de vue linguistique entre quelques langues véhiculaires: l’anglais, majoritaire, le japonais pour les publications techniques, le russe, l’allemand et le français.

Les chercheurs sont incités à publier dans les revues anglo-saxonnes en anglais pour s’insérer dans la recherche américaine s’ils veulent figurer dans le S.C.I. (Science Citation Index ) de l’Institute for Scientific Information de Philadelphie.

Par contre, au niveau des mots clés, on a établi des thesaurus multilingues et à partir de là des indexations, qui seront valables et utilisables informatiquement (dans des bases de données, par exemple) dans toutes les langues auxquelles le thesaurus multilingue donne accès.

Ainsi, moyennant un investissement supplémentaire modéré, on acquiert la possibilité d’un réel partage des tâches entre des équipes situées dans des pays différents. Certes la difficulté d’ériger des thesaurus multilingues varie selon les disciplines: plus la discipline se développe, plus le thesaurus se spécialise et doit renvoyer à d’autres «sous-thesaurus». On a fait un thesaurus trilingue sur le cancer, plusieurs thesaurus bilingues (par exemple E.D.F., I.N.S.E.R.M.).

L’information scientifique est toujours en mouvement. Les méthodes traditionnelles ne sont plus fiables devant le flux croissant des informations. Mais, fort heureusement, les progrès technologiques mettent à la disposition des documentalistes des moyens très puissants (informatique et télécommunications), grâce auxquels il est possible de faire passer dans l’application et de faire progresser sur le plan concret nombre de recherches linguistiques, qui apportent une aide précieuse à la diffusion d’informations pertinentes.

documentation [ dɔkymɑ̃tasjɔ̃ ] n. f.
• 1870; de documenter
1Recherche de documents pour appuyer une étude. Travail, fiches de documentation. Centre de documentation et d'information (C. D. I.) d'un lycée, d'un collège. Documentation automatique : ensemble des procédés informatisés de recherche, stockage, repérage et diffusion des documents.
2Ensemble de documents relatifs à une question. Réunir de la documentation sur un sujet. Documentation riche, variée.
Notice informative, explicative. Auriez-vous une documentation sur ce téléviseur ?
3Activité de documentaliste. Abrév. fam. (1977) DOC [ dɔk ].

documentation nom féminin (de documenter) Action d'appuyer une assertion, un récit, etc., sur des documents : Service de documentation. Ensemble des documents réunis à cet effet : Réunir une documentation sur une question. Ensemble de documents fournis avec un appareil, un jeu, un programme informatique, etc., et donnant des renseignements sur leur structure, leur fonctionnement, leur utilisation, etc. Ensemble des opérations, des méthodes, etc., qui facilitent la collecte, le stockage, la recherche et la circulation des documents et de l'information. (La documentation automatique utilise l'informatique.)

documentation
n. f.
d1./d Action de documenter, de se documenter.
d2./d Ensemble de documents. Une riche documentation.
|| Centre de documentation: endroit où sont réunis des ouvrages et documents sur un sujet.

⇒DOCUMENTATION, subst. fém.
A.— Action d'appuyer ce que l'on avance (par écrit ou oralement) sur des documents. Documentation abondante, bibliographique, précieuse, précise. Livre artificiellement fabriqué, à coups patients de menues documentations (GIDE, Journal, 1940, p. 32). Cf. chiffre ex. 8 :
Zola décrivait bien les instruments chirurgicaux, tout ce qui brille et se voit, mais négligeait de montrer le drame qui se jouait là, à l'intérieur des êtres, et qui était peut-être la seule réalité. M. Duhamel en conclut qu'on ne saurait remplacer la connaissance par la documentation...
MASSIS, Jugements, 1924, p. 171.
P. méton. Ensemble de documents relatifs à une question, à un ouvrage. Une abondante documentation illustrée (CENDRARS, Bourlinguer, 1948, p. 322). Rassembler une documentation exhaustive (BEAUVOIR, Mandarins, 1954, p. 89).
B.— En partic. ,,Travail spécialisé consistant à rechercher, sélectionner, classer, diffuser et conserver tous documents portant sur un ensemble de sujets ou sur un sujet particulier`` (ROLLAND-COUL., 1969). Organisme, service de documentation; langage de documentation; documentation automatique. Un centre de documentation d'horlogerie, par exemple, aurait sa place toute trouvée à Cluses (Civilis. écr., 1939, p. 4812).
Prononc. et Orth. :[]. Ds Ac. 1932. Étymol. et Hist. 1877 (LITTRÉ Suppl.). Dér. du rad. de documenter; suff. -(a)tion. Fréq. abs. littér. :111. Bbg. (D.). La Documentologie. R. intern. de la docum. 1965, t. 32, pp. 152-153.

documentation [dɔkymɑ̃tɑsjɔ̃] n. f.
ÉTYM. 1870; de documenter, et -ation.
1 Action de rechercher des documents. || Travail, fiches de documentation.
2 Ensemble de documents réunis. || Rechercher de la documentation. || Préparer, compléter sa documentation. || Documentation riche, variée; insuffisante, rudimentaire. || Documentation archivée ( Archives), classée, gérée par ordinateur, analysée (analyse documentaire).
0 (…) la documentation (…) était nouvelle : puisée aux Archives, dans l'énorme collection des actes, des imprimés, des manuscrits, des registres des fédérations (…) accrue par les récits et par les souvenirs des survivants de l'extraordinaire drame (…)
Émile Henriot, les Romantiques, p. 399.
Abrév. fam. : doc, n. f. (1977, in D. D. L.).
3 Techn. Activité qui consiste à réunir, gérer, analyser, diffuser des documents dans un but déterminé. || Documentation automatique : informatique documentaire. || Spécialiste de la documentation. Documentaliste. || Union française des organismes de documentation (U. F. O. D.). || Centres de documentation. Documentaire. || Services de documentation.
DÉR. V. Documentaliste.

Encyclopédie Universelle. 2012.

Regardez d'autres dictionnaires:

  • Documentation — is a term used in several different ways. Generally, documentation (to document) refers to the process of providing evidence. Modules of Documentation are Helpful. The most common meanings are: the process of documenting knowledge (or rather… …   Wikipedia

  • documentation — doc‧u‧men‧ta‧tion [ˌdɒkjmənˈteɪʆn, men ǁ ˌdɑːk ] noun [uncountable] 1. documents that are used to prove that something is true or correct, or as a record of something: • He was asked to provide documentation of his personal finances. 2.… …   Financial and business terms

  • Documentation — see «Document» Источник …   Словарь-справочник терминов нормативно-технической документации

  • documentation — I noun annals, authentication, authority, basis, certification, circumstantiation, confirmation, corroboration, data, evidence, evidential record, evidentiary record, exhibit, factual basis, grounds, grounds for belief, medium of proof, proof,… …   Law dictionary

  • documentation — 1754, admonition, from M.L. documentationem (nom. documentio) admonition (see DOCUMENT (Cf. document)). Meaning furnishing with documents or papers is from 1884, probably from DOCUMENT (Cf. document). Meaning collection of informational papers is …   Etymology dictionary

  • documentation — ► NOUN 1) the documents required in the provision of information or evidence. 2) written specifications or instructions …   English terms dictionary

  • documentation — [däk΄yəmən tā′shən, däk΄yəmentā′shən] n. 1. the supplying of documents or supporting references; use of documentary evidence 2. the documents or references thus supplied 3. the collecting, abstracting, and coding of printed or written information …   English World dictionary

  • Documentation — La documentation est l action de sélectionner, de classifier, d utiliser, et de diffuser des documents. Le métier de documentaliste est donc à classifier dans le domaine des services, mais aussi dans le domaine de l éducation avec le métier de… …   Wikipédia en Français

  • documentation — n. 1) to provide documentation for 2) strong; weak documentation * * * [ˌdɒkjʊmen teɪʃ(ə)n] weak documentation strong to provide documentation for …   Combinatory dictionary

  • documentation — doc|u|men|ta|tion [ˌdɔkjumənˈteıʃən, men US ˌda:k ] n 1.) [U] official documents, reports etc that are used to prove that something is true or correct ▪ Applicants must provide supporting documentation . 2.) [U and C] the act of recording… …   Dictionary of contemporary English